Ending | Count |
---|---|
است. | 60411 |
شد. | 18997 |
شدهاست. | 16351 |
بود. | 15235 |
دارد. | 13387 |
کرد. | 12374 |
میشود. | 11567 |
بودهاست. | 8217 |
میباشد. | 7005 |
میکند. | 5656 |
هستند. | 3505 |
شود. | 3333 |
کند. | 3279 |
باشد. | 3119 |
داشت. | 2932 |
داد. | 2924 |
میکنند. | 2796 |
میشوند. | 2478 |
گرفت. | 2393 |
دارند. | 2097 |
میدهد. | 2008 |
کردند. | 1950 |
شدند. | 1947 |
نمود. | 1913 |
بودند. | 1764 |
کنند. | 1683 |
گردید. | 1610 |
یافت. | 1510 |
رسید. | 1496 |
میکرد. | 1463 |
In the next four subsections show the most frequent sentence endings consisting of N words, N=1, 2, 3, 4. In this subsection we start with N=1.
The most frequent word-N-grams at the end of sentences give some insight into sentence composition.
Especially for N=1, we only need a small corpus to identify the most frequent sentence beginnings.
select substring_index(sentence, ' ', -1) as beg, count(*) as cnt from sentences group by substring_index(sentence, ' ', 1) order by cnt desc limit 50;
4.3.1.1 Most Frequent Sentence Beginnings I
4.3.1.2 Most Frequent Sentence Beginnings II
4.3.1.3 Most Frequent Sentence Beginnings III
4.3.1.4 Most Frequent Sentence Beginnings IV
4.3.1.2 Most Frequent Sentence Endings II
4.3.1.3 Most Frequent Sentence Endings III
4.3.1.4 Most Frequent Sentence Endings IV